@奈良山
2年前 提问
1个回答
数据分析的目的是什么?
X0_0X
2年前
数据分析的目的有以下七点:
分类
检查未知分类或暂时未知分类的数据,目的是预测数据属于哪个类别或属于哪个类别。使用具有已知分类的相似数据来研究分类规则,然后将这些规则应用于未知分类数据。
预测
预测是指对数字连续变量而不是分类变量的预测。
关联规则和推荐系统
关联规则或关联分析是指在诸如捆绑之类的大型数据库中找到一般的关联模式。
在线推荐系统使用协作过滤算法,该协作过滤算法是基于给定的历史购买行为,等级,浏览历史或任何其他可测量的偏好行为或什至其他用户购买历史的方法。协同过滤可在单个用户级别生成“购买时可以购买的东西”的购买建议。因此,在许多推荐系统中使用了协作过滤,以向具有广泛偏好的用户提供个性化推荐。
预测分析
预测分析包括分类,预测,关联规则,协作过滤和模式识别(聚类)之类的方法。
数据缩减和降维
当变量的数量有限并且可以将大量样本数据分类为同类组时,通常会提高数据挖掘算法的性能。减少变量的数量通常称为“降维”。降维是部署监督学习方法之前最常见的初始步骤,旨在提高可预测性,可管理性和可解释性。
数据探索和可视化
数据探索的目的是了解数据的整体情况并检测异常值。通过图表和仪表板创建的数据浏览称为“数据可视化”或“可视化分析”。对于数值变量,可以使用直方图,箱形图和散点图来了解其值的分布并检测异常值。对于分类数据,请使用条形图分析。
有监督学习和无监督学习
监督学习算法是用于分类和预测的算法。数据分类必须是已知的。在分类或预测算法中用于“学习”或“训练”预测变量和结果变量之间关系的数据称为“训练数据”。 。从训练数据中学到算法后,将该算法应用于具有已知结果的另一个数据样本(验证数据),以查看其与其他模型相比具有哪些优势。简单线性回归是监督算法的一个示例。